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Prodn. of viral membrane protein domains (VMPD) in native form 
by (i) insertion of a nucleotide sequence for a recognition sequence, 
e.g. proteases or glycolipid anchors, into an appropriate site of the 
encoding gene (ii) expression of (i) in eukaryotic cells (iii) 
subjecting (ii) pref . to a cleavage by a protease which specifically 
recognises the inserted sequence and cleaves it, and (iv) isolating the 
desired protein domain from the mixture. Pref. the VMPD are ecto- 
domains of the HIV env-glycoprotein. 

The recognition sequence pref. is -(G-P-X)n with n more than 1, 
pref. 3 and X any aminoacid and the cleavage enzyme pref. is a 
collagenase . 

Also claimed are the domains of viral membrane proteins 
isolated by the process above which are present in native, pref. in 
oligomer and glycosylated form. 

USE - The isolated domains pref. are used (a) as a vaccine 
against viruses, in particular against HIV (b) for the prodn. of 
polyclonal and monoclonal antibodies, (c) for immuno therapy and (d) 
for their crystallisation. In contrast to prior art preparations, the 
env protein according to the invention is in the native form. 
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Isolation of viral domain membrane protein in a natural state 
comprises inserting a nucleotide sequence at a suitable site of the 
required protein domain of the gene that encodes the prodn. of the 
protein, so that a given aminoacid sequence will be expressed; then 
transformation of eucaryotic host cells with the recombinant gene 
mutant; propagation of the transformed cells; enzymatic degradation of 
the expressed protein, pref. with a protease which cleaves the protein 
at the inserted aminoacid sequence; and isolation of the remaining 
protein. 

USE/ADVANTAGE - The process is applicable to the ectodomain of 
the HIV glycoprotein envelope, facilitating the isolation of the 
membrane protein for diagnostic and potential therapeutic use. The 
process is highly specific, so that the resulting protein is free from 
unwanted contaminants . 
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inserted into the gene coding for a viral membrane protein containing 
the desired ectodomain, the gene mutant obtained in this manner is 
expressed in eukaryotic cells for obtaining the membrane protein in 
native, oligomeric and glycosylated form including the inserted 
recognition sequence, the ecodomain is separated in native, oligomeric 
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B schreibung 

Die vorliegende Erfindung betrifft ein Verfahren zur Gewinnung von isolierten Ektodomanen viraler Membranpro- 
teine in nativer, oligomerer und glykosylierter Form, insbesondere von Ektodomanen des Oberflachenproteins gp160 

s des menschlichen Immunschwachevirus HIV (Human Immunodeficiency Virus), dem Erreger von AIDS (Aquired Im- 
mune Deficiency Syndrome), weiterhin die durch dieses Verfahren gewonnenen Ektodomanen selbst sowie deren 
Verwendung als Impfstoff, insbesondere die Verwendung nativer Ektodomanen des Oberflachenproteins gp160 des 
menschlichen Immunschwachevirus HIV als Impfstoff gegen HIV. Bestandteil dieses Verfahrens zur Gewinnung von 
isolierten Ektodomanen viraler Membranproteine ist auch ein Verfahren zur Ermittlung geeigneter Stellen fur den Ein- 

io bau von Erkennungssequenzen in die zu gewinnende Proteindomanen, die als enzymatische Spaltstellen dienen, 
insbesondere als Collagenasespaltstellen, sowie Erkennungssequenzen fur Collagenasen selbst. 

Ein probates Mittel zur Prophylaxe von Viruserkrankungen ist die Immunisierung, die Impfung des Korpers gegen 
die Wen. Durch Impfung konnten viele in fruheren Zeiten oft epidernieartig verlaufende Viruserkrankungen wie z.B. 
die Pocken und Polio eingedammt werden. Zur Erlangung einer solchen aktiven Immunisierung gegen ein Virus setzt 

15 man den Korper, genauer gesagt das Immunsystem, einem viralen Antigen aus. Dies kann geschehen beispielsweis 
durch Injektion von inaktivierten bzw. attenuierten Viren oder auch von Teilen, z.B. von Proteinen des Virus. Grund- 
satzlich setzt sich das Immunsystem des Menschen aus zwei verschiedenen Teilsystemen zusammen. Die zellulare 
Immunantwort (T-Zellen) und die humorale Immunantwort (B-Zellen, Antikorper). Bei der Neuinfektion mit einem Virus 
stellt die humorale Immunantwort, durch B-Zellen vermittelt, den wichtigsten Abwehrmechanismus dar. 

20 Das Immunsystem des Korpers reagiert auf das Antigen mit der Bildung von spezifischen Antikorpem, die das Antigen 
und damit das Virus erkennen und binden und dadurch dessen Inaktivierung in die Wege leiten. Daruberhinaus werden 
sogenannte "Gedachtniszellen" gebildet, das sind spezielle Lymphozyten, die bei einer spateren Infektion mit "ihrem" 
Virus bzw. "ihrem" Antigen aktiviert werden und das Immunsystem sehr rasch zur Synthese von groBen Mengen der 
antigenspezifischen Antikdrperstimulieren. Dadurch kann das Immunsystem wesentlich schneller auf einen Virusbefall 

25 reagieren, als wenn es vorher noch nicht mit dem entsprechenden Antigen konfrontiert worden ist. 

Die Verwendung von attenuierten Viren zur Impfung kann allerdings insofem problematisch sein, als nicht ausge- 
schlossen werden kann, daft die verwendeten Viren im Korper wieder virulent werden und es zum Ausbruch der Vi- 
ruserkrankung kommt. Aus diesem Grund ist es vorzuziehen, ein isoliertes Protein des Virus als Immunogen zu ver- 
wenden. Hierzu verwendet man am besten ein Oberf lachenprotein des Virus, da dieses normalerweise der humoralen 

30 Immunantwort gut zuganglich ist. Idealerweise verwendet man nur einen Teil eines Oberflachenproteins, und zwar 
denjenigen Teil, der sich auBen auf der Virusoberflache befindet, die sogenannte Ektodomane, da beim tntakten Virus 
nur dieser Teil fur Antikorper zuganglich ist. Bei der Herstellung einer Proteindomane, die zur Impfung gegen ein Virus 
eingesetzt werden soli, ist allerdings zu beachten, daft sie moglichst die native Form haben sollte, da anderenfalls die 
Gefahr besteht, daB Antikorper gebildet werden, die das native Protein, und damit das Virus nicht erkennen und somit 

35 bei der Neutralisation wirkungslos sind. Solche Molekule oder Molekulteile, die aufgrund Ihrer dreidimensionalen Struk- 
tur von Antikorpem erkannt werden, nennt man konformationelle bzw. strukturelle Epitope, diejenigen, die an ihrer 
Aminosauresequenz erkannt werden, sequentielle Epitope. Es zeigt sich immer mehr, daG es nur sehr wenige sequen- 
tielle Epitope gibt, die meisten antigenen Epitope sind strukturell, d.h. sie mussen die korrekte dreidimensionale Faltung 
der Polypeptidkette aufweisen, urn von entsprechenden Antikorpem erkannt zu werden. Nativ bedeutet in diesem 

40 Zusammenhang, daB die raumliche Struktur der verwendeten Proteindomane identisch oder nahezu identisch ist mit 
der Struktur des entsprechenden, naturlicherweise auf oder in dem Virus vorkommenden Proteinbereiches. Dies 
schlieBt gegebenenfalls das Vorhandensein von Oligomerie und / oder Glykosylierung der Proteindomane ein. Ein 
wichtiges Kriterium hierfur ist, daB Antikorper, die gegen eine isolierte native, virale Proteindomane gebildet worden 
sind, auch den Virus bzw. das entsprechende native Protein im Virus erkennen und binden. 

45 GroBe Probleme bereitet heutzutage das menschliche Immunschwachevirus HIV, ein Retrovirus. Seit es im Jahre 1 984 
als Ursache von AIDS identiftziert worden ist, werden groBe Anstrengungen untemommen, auch gegen dieses Virus 
einen Impfstoff herzustellen. In jungerer Zeit ist es gelungen, Affen mit abgeschwachten SIV-Viren (Simian Immun- 
odeficiency Virus), nahen Verwandten des HIV, erfolgreich zu immunisieren, was vermuten laBt, daB auch Menschen 
erfolgreich gegen HIV immunisiert werden konnten mittels abgeschwachten HIV. Die Problematic die abgeschwachte 

50 Viren als Impfstoffe mit sich bringen, wurde schon angesprochen. Bei einer todlich verlaufenden Krankheit wie AIDS 
kann dieses Risiko, daB der abgeschwachte Virus wieder virulent wird, nicht in Kauf genommen werden, auch wenn 
es sehr klein ist. Siehe hierzu auch: Koff, W.C. und Hoth, D.F. in der Zeitschrift "Science", 241, 426-432 (1988). 
Aus diesem Grund konzentriert sich ein groBer Teil der Forschung Ober HIV-lmpfstoffe darauf, einzelne Proteine, ins- 
besondere das Oberflachenprotein des Virus, das sogenannte gp1 60, auch env-Glykoprotein genannt, oder Fragmente 

55 davon als Antigen zu verwenden. [Eine allgemeine Obersicht gibt der Artikel "AIDS-lmpfstoffe" von T.H. Matthews et 
al. in der Zeitschrift "Spektrum der Wissenschaft" 12, 134-142 (1 988)]. 

Das env-Glykoprotein von HIV, dessen Aminosauresequenz bekannt ist [Ratner et al., "Nature" 313, 277-284 (1985)] 
wird in der Wirtszelle zunachst als stark glykosyliertes Vorlauferprotein gp1 60 synthetisiert und anschlieBend im Golgi- 
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Apparat zu den beiden Domanen gp120 und gp41 prozessiert. Die gp120-Domane, die sich auBen auf der Virusmem- 
bran befindet, ist fur die Bindung an den zellularen Rezeptor CD4 verantwortlich und sowohl gp120 als auch das 
Vorlauferprotein gp160 binden mit hoher Affinitat an diesen CD4-Rezeptor. Gp41, das eine Transmembrandomane 
aufweist, ist beteiligt an der Fusion von viraler und zellularer Membran wahrend des Eindringens des Virus in die Zelte, 

s wahrscheinlich durch Interaktion eines "Fusionspeptids", das am Aminoterminus von gp41 liegt, mit der Lipiddoppel- 
schicht der Wirtszellmembran. 

Vielversprechend erscheint der Ansatz, fur die Entwicklung eines HIV-lmpfstoffs lediglich den auBeren Teil des 
env-Glykoproteins zu verwenden. Dem liegt die bereits erwahnte Uberlegung zugrunde, daB der nach auBen expo- 
nierte Teil des G lykoproteins am leichtesten der humoralen Immunantwort zuganglich ist und daher eine Immunisierung 

10 gegen diese Ektodomane am erfolgversprechendsten ist. 

Die Gewinnung der Ektodomane des HI V-Oberflachenproteins kann auf unterschiedliche Art und Weise erfolgen. 
Sie kann beispielsweise durch mechanische, chemische Oder enzymatische Methoden von der Virushulle "abgeschnit- 
ten" werden. Dabei ist die Gefahr groB, daB das Protein denaturiert wird und zur Bildung von Antikorpern fuhrt, die 
das native Oberfiachenprotein und damit den Virus nur schlecht oder gar nicht erkennen. 

*5 Robey et al. ["Proc. Natl. Acad. Sci. USA", 83, 7023-7027 (1986)] gewinnen gp120 beispielsweise durch Ablosen des 
Proteins von der Oberflache HIV-infizierter Zelien mittels des recht starken Detergenz Triton X100. Auch wenn die 
Autoren ihre Preparation "natives gp120" nennen, ist in Anbetracht des verwendeten Detergenz und der verwendeten 
Reinigungsmethoden zu bezweifeln, daB das so gewonnene gp1 20 tatsachlich in nativer und oligomerer Form vorliegt. 
In der europaischen Patentanmeldung EP 0 328 403 ist vorgeschlagen, lediglich Peptide aus HIV-gpt20 mit einer 

20 Lange zwischen 28 und 33 Aminosauren als Impfstoff gegen HIV zu verwenden. Diese Peptide liegen aber nicht in 
nativer, insbesondere oligomerer Form vor. 

Ein gentechnologischer Ansatz besteht darin, ein Stopcodon quasi als "Sollbruchstelle" knapp vor Beginn des 
gp41-Gens einzubauen. Bei der Expression des Gens in geeigneten Zeilen bestimmt die Lage des Stopcodons dann 
die Lage des carboxyterminalen Endes der Ektodomane des Oberflachenproteins, das heiBt, es wird nur der auBere 

25 Teil des Oberflachenproteins, die Domane gp1 20 synthetisiert. Auf diese Art synthetisiert, liegt gp1 20 aber als Monomer 
vor, was nicht den naturlichen Verhaltnissen am Virus entspricht, da das env-Glykoprotein wie die meisten viral n 
Glykoproteine in nativer Form als Oligomer vorliegt. Haufig sind diese ProteineTrimere, f Or das HIV-1 env-Glykoprotein 
konnte kurzlich gezeigt werden, daB es in nativer Form ein Tetramer ist [Schawaller M. et al., "Virology", 172, 367-369 
(1989)]. Dies erklart, weshalb monomeres gp120 nicht zu geeigneten Antikorpern fuhrt und somit als Impfstoff wenig 

30 brauchbar ist. Auch eigene Experimente des Erfinders, bei denen gp1 20 von Zeilen synthetisiert wurde, die mit einem 
recombinanten Vaccinia- Virus, durch den env exprimiert wird, infiziert worden waren, zeigten, daB gp120 nicht stabil 
in oligomerer Form gebildet wird. Die Versuchsergebnisse deuten darauf hin, daB gp41 wahrend der Biosynthese des 
env-G lykoproteins anwesend sein muB, urn die Oligomerisierung zu gewahrleisten. Wahrscheinlich liegt diejenige Do- 
mane von gp41, die fur diese Oligomerisierung verantwortlich ist, innerhalb der 129 aminoterminalen Aminosauren 

35 von gp41 [Earl, PL et al. "Proc. Natl. Acad. Sci. USA", 87, 648-652 (1990)]. 

Da gp41 offensichtlich eine wichtige Bedeutung bei der Synthese von nativem gp160 hat, wurden auch Versuche 
unternommen, das komplette gp160 in stabiler Form herzustellen. Barret et al. ["AIDS Research and Human Retrovi- 
ruses" 5 (2), 159-170 (1989)] gewinnen gp160 beispielsweise durch Expression des env-Gens in eukaryontischen 
Zeilen und anschlieBender Reinigung, wobei sie allerdings neben Detergentien auch das stark chaotrop wirkende 

40 Kaliumthiocyanat verwenden, welches Proteine denaturiert. Eigene Arbeiten des Autors haben gezeigt, daB die Rein- 
darstellung von gp160 groBe Schwierigkeiten bereitet, und zwar aus folgenden Grunden: 

Gp160 ist, wie oben beschrieben, ein Membranprotein. Zur Herauslosung dieses Proteins aus der Membran sind De- 
tergentien notwendig. Diese sind auch deshalb notig, da isolierte gp160 Molekule bei Abwesenheit von Detergentien 
aggregieren. Detergentien fuhren aber zu einer Veranderung des Molekuls. Es wurde festgestellt, daB gp160 mit De- 

45 tergentien eine Veranderung des Proteaseverdaumusters im Vergleich zum unbehandelten Protein zeigt. Beim Ent- 
fernen des Detergenz aus der Losung, was spatestens dann notig wird, wenn das Protein beispielsweise zum Zwecke 
der Impfung einem Patienten injiziert werden soil, zerfallt das Oligomer zum Monomer. Aus den genannten Grunden 
erscheinen die Chancen, reines gp160 in nativer Form herstellen zu konnen, sehr gering zu sein. 

Der wesentliche Nachteil, den alle bisherigen Ansatze zur Entwicklung eines Impfstoffes gegen HIV auf der Basis 

50 der isolierten Ektodomane des env-Glykoproteins gemeinsam haben, ist also hochstwahrscheinlich der, daB das als 
Immunogen verwendete Protein nicht in nativer und oligomerer Form vorhanden war. Dies wird dadurch deutlich, daB 
die von den Autoren angegebenen Titer, die mittels ELISA ermittelt wurden, sehr hoch (urn 1/1 00 000), die im Neutra- 
lisierungstest gemessenen Titer dagegen extrem niedrig sind (oft weit wenigerals 1/1000). Dies deutet darauf hin, daB 
die jeweils verwendeten Antigene zwar starke immunogene Wirkung besitzen, also eine groBe Menge Antikorper da- 

55 gegen gebildet werden, daB diese Antikorper aber das native Protein, und damit auch den Virus kaum oder gar nicht 
erkennen. 

Die niedrigen Titer im Neutralisierungstest zeigen, daB das native Antigen erkennende Antikorper nur in sehr 
niedrigen Titern vorhanden sind. Niedertitrige Antikorper aber fuhren haufig zu einer Erhohung der Wusinfektivitat 
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[Prabhakar et al., Nature 290, 590 (1981)]. Mit anderen Worten, anstatt den Wirt vor der Infektion zu schutzen, wird 
durch virusspezifische Immunglobuline die Infektivitat erhoht. In diesem Fall hat die Vaccine das Gegenteil des ge- 
wunschten Effektes zur Folge. Die geschilderte Problermatik ergibt sich auch bei alien anderen Wen, die eine Ober- 
flachenmembran mit membrangebundenen Proteinen besitzen. 
5 Neben der Verwendung als Impfstoff werden native Proteine bzw. Proteindomanen auch als Immuntherapeutikum 

Oder furdiagnostische Zwecke verwendet. Fur die Diagnose werden sowohl Antigene, als auch die dagegen gerichteten 
Antikorper eingesetzt. 

Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Gewinnung von isolierten Ektodomanen viraler Mem- 
branproteine, insbesondere Ektodomanen des env-Glykoproteinsgp160 des menschlichen Immunschwachevirus HIV 
10 zurVerfugungzustellen, die beispielsweiseals I mpfstoff^urlmmuntherapieoder furdiagnostische Zwecke verwendet 
werden konnen. Diese Aufgabe umfaQt auch die Zurverfugungstellung eines Verfahrens zur Identifikation einer geeig- 
neten Stelle zum Einbau einer Erkennungssequenz f Or proteinspaltende Enzyme, insbesondere Collagenasen, in virale 
Membranproteine, beispielsweise in das HI V-env Glykoprotein gpl60, sowie die Zurverfugungstellung einer geeigne- 
ten Collagenasespaltstelle. 

15 Diese Aufgabe wird durch Bereitstellung eines Verfahrens zur Gewinnung von isolierten Ektodomanen viraler 

Membranproteine in nativer, oligomerer und glykosylierter Form gelost, dadurch gekennzeichnet, daft 

in das Gen, das fur ein virales, die gewunschte Ektodomane enthaltendes Membranprotein kodiert, eine Nukleo- 
tidsequenz insertiert wird, die fur eine Aminosauresequenz kodiert, welche eine Erkennungssequenz fur protein- 
ic spaltende Enzyme darstellt, 

die so erhaltene Gen-Mutante in eukaryontischen Zellen zum Erhalt des Membranproteins in nativer, oligomerer 
und glykosylierter Form einschlieBlich der insertierten Erkennungssequenz exprimiert wird, 

25 - die E ktodomane in nativer, oligomerer und glykosylierter Form durch enzymatische Spaltung des Membranproteins 
mit fur die Erkennungssequenz spezifischen proteinspaltenden Enzymen von den eukaryontischen Zellen oder 
Teilen hiervon abgetrennt wird, und 

die Ektodomane in nativer, oligomerer und glykosylierter Form aus dem Gemisch isoliert wird. 

30 

Ein weiterer Gegenstand der vorliegenden Erfindung sind isolierte Ektodomanen viraler Membranproteine in na- 
tiver, oligomerer und glykosylierter Form. 

Ganz allgemein gesprochen bedeutet dies, daG zunachst an geeigneter Stelle in das Gen, das fur die Ausgangs- 
form (z.B. gp160), das Vorlauferprotein derzu gewinnenden Proteindomane, codiert, eine fur eine Aminosauresequenz 

35 codierende Nukleotidsequenz eingebaut wird, welche eine Erkennungssequenz fur proteinspaltende Enzyme, insbe- 
sondere Proteasen, oder Glykolipidanker darstellt. Nach erfolgter Synthese des Proteins durch geeignete eukaryon- 
tische Zellen wird es an der insertierten Erkennungssequenz mit den entsprechenden Enzymen gespalten und an- 
schlieBend die gewunschte Proteindomane aufgereinigt. Bei Verwendung des HIV env-Glykoproteins gp160 als Vor- 
lauferprotein resultieren aus diesem Verfahren oligomere, insbesondere tetramere Glykoproteine, deren Monomere 

40 eine elektrophoretische Mobilitat von ca. 140 kD aufweisen und die im folgenden gp140 genannt werden. 

Der Erfindung liegt also die Idee zugrunde, zunachst das komplette Protein zu synthetisieren, da es nur auf diese 
Weise in nativer und oligomerer Form synthetisierbar ist, und nach erfolgter Synthese die gewunschte Proteindomane 
an spezifischer Stelle enzymatisch abzuspalten. Zuvor wird das korrespondierende Gen derart manipuliert, da(3 das 
fertige Protein eine zusatzliche Aminosauresequenz beinhaltet, die als Erkennungssequenz fur proteinspaltende En- 

45 zyme oder fur Glycolipidanker dient. Diese zusatzliche Sequenz andert nicht die native Proteinstruktur. Durch enzy- 
matische Spaltung des Gesamtproteins an dieser Erkennungssequenz erhalt man die gewunschte Proteindomane in 
nativer und oligomerer Struktur. Ihrer Natur nach ist diese Erkennungssequenz eine Aminosauresequenz, die von 
Proteasen erkannt und gespalten wird, es kann aber auch eine Erkennungssequenz fur Lipidanker sein, wobei mittels 
Lipasen ebenfalls eine gezielte Spaltung mdglich ist [siehe hierzu: Ferguson, M.A.J.; An. Rev. Biochem. 57, 285-320 

so (1988)] 

Im ersten Schritt des erfindungsgernaGen Verfahrens muB zunachst der fur den Einbau einer Erkennungssequenz 
geeignete Bereich im Protein identifiziert werden. Dies erfolgt mittels einer "Pepscan" genannten Methode. Dann wird 
in der dem identifizierten Proteinbereich entsprechenden Gensequenz eine Erkennungssequenz fur eine Endonuklea- 
se, z.B. EcoR I erzeugt, in die hinein dann die Sequenz, die fur die gewunschte Aminosauresequenz - die Erkennungs- 
55 sequenz im Protein - codiert, eingebaut wird. Es kann anstatt EcoR I auch jede andere Endonuklease verwendet 
werden, es sollten allerdings in dernaheren Umgebung der Erkennungssequenz dieser Endonuklease keine weiteren 
gleichartigen Erkennungssequenzen vorhanden sein, da ansonsten die Klonierungseffizienz abnehmen kann. Das so 
erhaltene Gen wird in einen Vektor, beispielsweise ein Plasmid, eingebaut, der in geeignete eukaryontische Zellen 
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transfiziert wird, welche dann das gesamt Prot in inclusive der insertierten Erkennungssequenz synthetisieren. Auf 
diese Weise erhalt man das gesamte Prot in in nativer, oligomerer und glycosilierter Form. Daraufhin wird mit einem 
geeigneten Enzym, das das Protein an der eingebauten Erkennungssequenz schneidet, die gewunschte Domane vom 
Rest des Proteins abgetrennt. Mittels geeigneter Reinigungsmethoden wie z.B. Affinitatschromatographie, lonenaus- 

5 tauschchromatographie oder Gradientenzentrifugation wird die gewunschte Proteindomane anschlieBend aufgerei- 
nigt. Was das verwendete spaltende Enzym betrifft, so ist das wesentliche Kriterium fur dessen Eignung, daB es die 
Spaltstelle an deren Aminosauresequenz erkennt. Diese Bedingung ertuilen bakterielle Collagenasen, auch vereinzelt 
pflanzliche Collagenasen sowie z.B. der Blutgerinnungsfaktor Xa. 

In einer bevorzugten Ausfuhrungsform der Erfindung wird zur Erhohung der Ausbeute die naturliche Prozessie- 

10 rungssequenz des Vorlauferproteins zerstort. Dies erfolgt beispielsweise durch Austausch einer oder mehrerer Ami- 
nosauren in der Prozessierungssequenz. Dies hat zur Folge, daB das Vorlauferprotein, im Falle von HIV das gp160, 
nicht in die einzelnen Domanen (bei HIV also gp41 und gp120) aufgespalten wird. 

Das Vorlauferprotein wird im rauhen endoplasmatischen Retikulum (RER) der Zellesynthetisiert. Erst im Golgi-Apparat, 
also wahrend des Transports zur Zelloberflache, wird das Protein prozessiert, d.h. in die einzelnen Domanen aufge- 

15 spalten. Wird die Prozessierungssequenz des Vorlauferproteins zerstort, gewinnt man nicht nur den Anteil an Vorlau- 
ferprotein, der zumZeitpunktder Membranpraparation noch im RERvorhanden ist, sondern zusatzlich auch das bereits 
zur Zelloberflache transportierte unprozessierte Vorlauferprotein. 

In einer weiteren bevorzugten Ausfuhrungsform der Erfindung erfolgt die Einschleusung des mutanten Gens in 
die eukaryontische Zelle nicht mittels eines Plasmids, sondern mittels eines rekombinanten Virus, insbesondere mittels 

20 eines rekombinanten Vaccinia Virus. Besonders fur die Herstellung groBerer Mengen der gewunschten viralen Prote- 
indomanen ist die Verwendung eines rekombinanten Vaccinia Virus als Vektor vorteilhaft. Die jeweilige Genmutante 
kann beispielsweise in das Thymidinkinase-Gen des Vaccinia Virus insertiert werden. Da die Wahrscheinlichkeit fur 
eine solche Rekombination beica. 1/1000 bis 1/10 000 liegt, ist es vorteilhaft, nach der Rekombination auf den rekom- 
binaten Virus zu selektionieren. Dies kann beispielsweise durch Einsatz des Mutagens Bromodesoxyuridin in HTK - - 

25 Zellen erfolgen. Nur der Wildtyp-Vaccinia Virus (TK + ) baut dieses mutagene Nukleotidderivat in die DNA ein und schon 
nach zweimaliger Selektion liegt der Anteil der rekombinanten Viren (TIC) bei ca. 90%. Hohe Proteinausbeuten erhalt 
man bei Verwendung eines Late-Promotors, beispielsweise des Cowpox-160K-Promotors, der ein starker Nfeccinia- 
Promotorist[Patel, D. D. etal., 'Proc. Natl. Acad. Sci. USA" 85, 9431-9435 (1988)]. EineUbersicht uber die Verwendung 
des Vaccinia Virus als Vektor fur die Expression von Genen im Cytoplasma eukaryotischer Zellen gibt Moss, B., ["Sci- 

30 ence" 252, 1 662-1 667 (1 988)]. 

Weitere Spezifikationen im Hinblickauf das erfindungsgemaBe Verfahren, eine erfindungsgemaBe Erkennungs- 
sequenz sowie die erfindungsgemaBen nativen Proteindomanen und deren Verwendung sind Gegenstand der Unter- 
anspruche. 

Die Erfindung, die oben ganz allgemein skizziert ist, wurde gemacht bei der Untersuchung der Struktur des env- 
35 Glykoproteins von HIV, sie kann aber prinzipiell bei alien Viren angewandt werden, die eine Envelope-Membran be- 
sitzen. Fur Kristallisationsversuche mit der Ektodomane des env-Glykoproteins war es notig, diese Ektodomane in der 
nativen oligomeren Form ohne die hydrophobe transmembrane Domane herzustellen. Der OligomerisierungsprozeB 
von viralen Glykoproteinen vom Typ I ist aber wahrscheinlich abhangig von der Anwesenheit dieser hydrophoben 
transmembranen Domane wahrend der Biosynthese. Daruberhinaus scheint die Faltung der Polypeptidkette dadurch 
40 beeinfluBt zu werden, daB die Polypeptidkette wahrend der Synthese membrangebunden ist. Urn die Ektodomane des 
env-Glykoproteins in nativer Form zu erhalten, wurde nach dem Einbau einer fur eine Collagenasespaltstelle codie- 
renden Sequenz in das env-Gen zunachst das gesamte, mutante env-Glykoprotein in COS-Zellen synthetisiert, danach 
die gewunschte Ektodomane mittels einer bakteriellen Collagenase vom synthetisierten Gesamtprotein abgespalten 
und anschlieBend aufgereinigt. 

4 $ Als groBes Problem erwies sich dabei, eine geeignete Stelle im Protein fur den Einbau der Collagenasespaltstelle 

- der Erkennungssequenz - zu identifizieren. Es hat sich namlich gezeigt, daB es nur einen sehr kleinen Bereich im 
Protein gibt, an der die Erkennungssequenz eingebaut und das Protein dann auch erfolgreich gespalten werden kann. 
Bei rein empirischer Ermittlung einer solchen geeigneten Stelle muBten mehr als 30 verschiedene env-Gen-Mutanten 
hergestellt werden, bei denen an unterschiedlichen Stellen in der gewunschten Region von gp41 die Erkennungsse- 

50 quenz eingebaut wurde, urn eine Stelle zu finden, an der die gewunschte proteolytische Spaltung moglich war. 

Die im folgenden verwendete Numerierung der Aminosauren des HIV env-Glykoproteins bzw. der Basen des HIV 
env-Gens bezieht sich auf die von Ratner verwendete Numerierung [Ratner et al., "Nature" 313, 277-284 (1985)]. 

Die genaue raumliche Struktur des env-Glykoproteins ist nicht bekannt, die Struktur des Bereichs des Proteins, 
in dem die Proteasespaltstelle sinnvollerweise eingebaut werden kann, stellt sich folgendermaBen dar (siehe auch 

55 Fig. 1): 

Geht man von Hydrophobizitatsprofilen von gp41 aus, ist die erste Aminosaure des transmembranen Bereichs nach 
Ansicht des Erfinders Trp 678. Uber die genaue Lage des transmembranen Bereichs von gp41 ist sich die Fachwelt 
allerdings nicht einig. Bolognesi, RD. ["Mol. Biol. Med." 7, 1-15 (1990)] nimmt beispielsweise an, daB der transmem- 
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brane Bereich des gp160 von Aminosaure 691 bis Aminosaure 712 reicht. Klar ist, daG die vier konservierten Glyko- 
sylierungsstellen von gp41, die an den Positionen611,616, 624und637 lokalisiertsind, aminoterminal zur transmem- 
branen Domane, also in der Ektodomane liegen mussen. Weiterhin kann man aus U V-Circulardichroismus-Messungen 
an gereinigten gp120- und gp160-Praparationen auf die Sekundarstruktur von gp41 schlieGen. Diese Messungen ha- 
ben ergeben, daG gp120 fast ausschlieGlich aus p-Faltblattstrukturen besteht, wahrend gp160 ca. 30% a-helicale 
Bereiche aufweist. Dies deutet darauf hin, daG die Sekundarstruktur von gp41 im wesentlichen eine cc-Helix ist. Dar- 
uberhinaus kann man aus Sequenzanalysen des env-Gens verschiedener HI V-Stamme schlieGen, daG die Region in 
gp41 zwischen Pro609unddemTransmembranbereich (Trp 678) ebenfalls a-helicale Strukturbesitzt. Diese Annahme 
wird noch dadurch unterstutzt, daG keiner der untersuchten HIV-Stamme zwischen Pro 609 und Trp 678 ein Prolin 
besitzt, welches wahrscheinlich die a-helicale Struktur unterbrechen wurde. Unter weiterer Einbeziehung der Ergeb- 
nisse des Erfinders und anderer, daG es sich bei dem HI V-env-Glykoprotein urn ein Tetramer handelt, kann man sich 
vorstellen, daG vier lange amphiphatische a-Helices eine umeinandergewundene Schraubenstruktur (coiled-coil) bil- 
den, wobei jeweils die hydrophoben Regionen der Untereinheiten miteinander interagieren und dabei die oligomere 
Struktur von gp41 stabilisieren. In diesem Modell liegen die hydrophilen Aminosaureseitenketten auGen an einer te- 
trameren Schraube, wobei bei verschiedenen Stammen verschiedene Aminosauren vorliegen konnen. 

Aufbauendauf den vorgenannten Hypothesen wurde fur den Einbau derErkennungssequenzdie Region zwischen 
der letzten Glykosylierungsstelle bei der Aminosaure 637 und dem Beginn der transmembranen Domane ausgewahlt, 
ein immerhin 40 bis 53 Aminosauren langes Stuck, je nachdem, wo man den Beginn des transmembranen Bereichs 
annimmt. Wesentlich fur die Funktionalitat der Erkennungssequenz ist, daG sie gut zugangiich sein muG fur das ent- 
sprechende spaltende Enzym. 

Auf der Basis dieser Erkenntnis, daG die Lokaiisierung einer geeigneten Stelle fur den Einbau einer Erkennungs- 
sequenz im wesentlichen von der Zuganglichkeit des entsprechenden Proteinbereichs fur das spaltende Enzym ab- 
hangig ist, wurde ein neues Verfahren entwickelt zur Identifizierung einer geeigneten Einbaustelle f Or eine Erkennungs- 
sequenz, welches Gegenstand der Patentanspruche 4-7 ist. 

Da Antikorper gegen ein Protein nur gegen diejenigen Strukturen gebildet werden konnen, die auBen an dem 
Protein liegen, die also den Zellen des Immunsystems zugangiich sind, und die Zuganglichkeit auch ein wesentliches 
Kriterium fur eine funktionsfahige Erkennungssequenz ist, konnen geeignete Bereiche im Protein fur den Einbau von 
Erkennungssequenzen dadurch identifiziert werden, daG man diejenigen Epitope identifiziert, gegen die nach Immu- 
nisierung mit dem jeweiligen Protein Antikorper gebildet werden. Horal R und Mitarbeiter haben zur Untersuchung, 
gegen welche Bereiche des HIV-1 env-Glykoproteins gp41 uberhaupt Antikorper gebildet werden, die sogenannte 
"Pepscan'-Methode angewandt [siehe Horal P. et al. in der Zeitschrift "J. Virol.", 65, 2718-2723 (1991 )]. Diese Methode 
wird bei der vorliegenden Erfindung, anders als bei Horal et al. zur Identifikation des geeigneten Bereichs im Protein 
fur die Erkennungssequenz eingesetzt. Hierzu werden im Prinzip kleine Bruchstucke des Proteins mit Antikorp rn 
gemischt, die durch Immunisierung eines Saugetieres mit dem gesamten Protein gewonnen wurden. In der Praxis wird 
nicht das Protein in Bruchstucke zerlegt, sondern der Einfachheit halber entsprechend der Proteinsequenz uberlap- 
pende Peptide mit einer Lange von 5 bis 30, insbesondere von 12 bis 16 Aminosauren synthetisiert. Diese Peptide 
werden mit Serum von HIV-1 -positiven Patienten versetzt. Die in diesem Serum vorhandenen Antikorper reagieren 
mit denjenigen Peptiden, die beim nativen Protein zugangiich an der Oberflache liegen und die damit potentielle Ein- 
baustellen fur Erkennungssequenzen darstellen. Mit dieser Methode kann der am besten geeignete Abschnitt im Pro- 
tein fur den Einbau einer Erkennungssequenz je nach Lange der verwendeten Peptide bis auf einen Bereich weniger 
Aminosauren identifiziert werden. Urn die genaue, optimale Stelle zu finden, werden soviele Proteinmutanten herge- 
stellt und getestet, wie notig sind, urn in dem zuvor identifizierten Bereich exakt die optimale Stelle fur die Erkennungs- 
sequenz zu lokalisieren. Beim env-Glykoprotein von HIV-1 liegt die am besten geeignete Stelle fur den Einbau einer 
Collagenasespaltstelle zwischen den Aminosauren Leu 659 und Leu 660 (siehe Fig. 2). Aufgrund der Kolinearitat von 
Gen- und Proteinsequenz entspricht dies den Nukleotiden A 7778 und T 7779 des env-Gens. 
Ausgehend von dieser Stelle ist in einem Bereich von jeweils 17 Aminosauren Richtung C-Terminus bzw. N-Terminus 
der Einbau einer Collagenasespaltstelle ebenfalls moglich, wobei mit zunehmendem Abstand mit geringeren Ausbeu- 
ten an Spaltprodukten und damit der gewunschten Proteindomane zu rechnen ist. Eine weitere Schwierigkeit stellte 
die Ermittlung der Struktur einer geeigneten Spaltstelle dar. Es gibt recht wenige Proteasen, die Polypeptide sequenz- 
spezifisch spalten. Beispiele fur hochspezifische Proteasen sind bakterielle, vereinzelt auch pflanzliche Collagenasen, 
oder der Blutgerinnungsfaktor Xa. Auch Erkennungssequenzen fur Glycolipidanker sind prinzipietl geeignet. Erschwe- 
rend kommt hinzu, daG die meisten Endoproteasen, anders als beispielsweise DNA Restriktionsendonukleasen, fur 
die Erkennung der Spaltstelle nicht nur auf die Sequenz, sondern auch auf bestimmte Sekundar- oderTertiarstrukturen 
des Substrates angewiesen sind, welche aber nicht bekannt sind. Weiterhin darf die Erkennungssequenz nicht zu groG 
sein, urn ausschlieGen zu konnen, daG durch ihre GroGe die Struktur des Gesamtproteins wesentlich beeinfluGt wird. 

Am besten geeignet als Erkennungssequenz hat sich eine kurze collagenahnliche Sequenz der allgemeinen Form: 
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-(G-P-X) n - 

wobei n> 1 , insbesondere 3 und X eine der 20 durch den genetischen Code festgelegten Aminosauren ist (Anspruch 4). 

5 Eine ahnliche Sequenz wird in der deutschen Patentanmeldung DE 37 31 874 vorgeschlagen, allerdings als Teil 
eines Fusionsproteins. Im Gegensatz zur vorliegenden Erfindung ist das Ziel, das in der Patentanmeldung DE 37 31 
874 verfolgt wird, besonders kleine Proteine bzw. Peptide in Fermentationsverfahren herzustellen. Da aber gerade 
derartige Peptide verstarkt einem proteolytischen Abbau in der Zeile ausgesetzt sind, wird vorgeschlagen, das Peptid 
als Teil eines groGeren Fusionsproteins zusammen mit einer bakteriellen Aminosauresequenz und einer collagenahn- 

10 lichen Sequenz in einer bakteriellen Wirtszelle zu synthetisieren und anschlieGend mit einer bakteriellen Collagenase 
zu spalten. 

Unter Verwendung der genannten collagenahnlichen Sequenz wurden drei verschiedene HI V-1 env-Gen Mutanten 
(E3CA, E3CB, E3CC) hergestellt, deren Expressionsprodukt mittels einer bakteriellen Collagenase in der gewunschten 
Weise spezifisch gespalten werden kann. Unter Verwendung dieser Mutanten lassen sich Ektodomanen des env- 

75 Glykoproteins als wasserlosliche oligomere, insbesondere tetramere Glykoproteine gewinnen, deren Monomere eine 
elektrische Mobilitat von ca. 140 kD aufweisen und daher gp140 genannt werden. Diese Proteine bestehen aus der 
Domane gp120 und einem Teil der Domane gp41 (Anspruche 11 bis 14). Da sie keine Transmembrandomane mehr 
aufweisen, sind anders als bei der Reinigung von komplettem gp160 keine starken Detergentien, welche die native 
Struktur der Glykoproteine verandern konnten, zur Auf reinigung dieser Glykoproteine notwendig. Klare Evidenzen 

20 dafur, daB gp1 40 oligomere Struktur besitzt, ergeben sich zum einen aus Sedimentationsanalysen [Fig. 4; siehe hierzu 
auch Earl, PL. et al. "Proc. Natl. Acad. Sci. USA", 87, 648-652 (1990)], zum anderen aus Crosslinking-Experimenten 
[zu dieser Methodik siehe Schawaller, M. etaL, "Virology" 172, 367-369(1989)]. DieGewinnung des oligomeren gp140 
unter Verwendung der env-Gen Mutante E3CA wird im folgenden Ausfuhrungsbeispiel in Verbindung mit den Figuren 
1 bis 4 naher erlautert. Es zeigen: 

25 

Fig. 1 : Schema des HI V-env-Glykop rote ins mit der Transmembrandomane in der Oberflachenmembran des Virus. 

Die Zahlen geben die Position der Aminosauren an nach der Nomenklatur von Ratner et al., "Nature" 31 3, 
277-284 (1 985). Die Domane gp41 beginnt bei Aminosaure 512, die aber in einem solchen Schema schlecht 
lokalisiert werden kann. 

30 Fig.2: Ausschnitte aus den Aminosauresequenzen der Produkte von Wildtyp-env-Gen (E1 (WT) des BH10-Klons 
und verschiedenen Mutanten. Die Veranderungen bei den Mutanten gegenOber dem Wildtyp-env-Produkt 
sind jeweils unterstrichen. 

Fig. 3: SpezifischeSpaltungdes Wildtyp-env- und des E3CA-env- Proteins durch unterschiedliche Konzentrationen 
an bakterieller Collagenase. Die erhaltenen Produkte wurden analysiert durch Immunoblotting nach gelelek- 

6 trophoretischer Trennung aut 6% SDS Polyacrylarnidgel und anschlieBende Detektion mit polykionalem Ka- 
ninchenserum gegen gp120. Danach erfolgte eine Autoradiographie unter Einsatz eines radioaktiv markier- 
ten sekundaren Antikorpers, der gegen Kaninchen-lmmunoglobuline gerichtet ist (Amersham IM 134). 

Fig.4: Sedimentationsanaiyse der Produkte des Collagenaseverdaus von Wildtyp- und E3CA-Mutanten-Membra- 
nen. Collagenasekonzentration: 200 mU/ml, 37°C, 3h. Die erhaltenen Produkte wurden geschichtet auf einen 
40 vorgeformten 5 bis 20 % Sucrosegradienten in 10 mM HEPES, pH 7.8, 150 mM NaCI und in einem SW41 

Rotor (Beckmann) fOr 16 h bei 35 000 UpM und 5°C zentrifugiert. Zehn Fraktionen wurden, vom Boden des 
GefaBes angefangen, geerntet und durch Immunoblotting analysiert. 

Die Konstruktion der env-Gen-Mutanten E3CA, E3CB, E3CC ist in Fig.2 illustriert, in der die Sequenz des Wildtyp 
45 env-Gens (E1) in der Transmembrandomane und der aminoterminal zur Transmembrandomane gelegenen Region 
dargestellt ist. An der fur Leu 659 codierenden Position wurde durch eine Punktmutation eine einzelne Schnittstelle 
fur die Endonuklease EcoR1 erzeugt, wodurch im Protein Leu gegen Phe ausgetauscht wird. Das daraus entstehende 
Produkt ist die env-Gen-Mutante E3. In diese neue EcoR1 Schnittstelle wurde eine Basensequenz insertiert, die fur 
folgende Aminosauresequenz codiert (zur Abkurzung von Aminosauren siehe z.B. A.L Lehninger, Biochemie, VCH- 
so Verlag Weinheim, 1987): 



VPAGPRGPRGPKF 

Diese 13 Aminosauren lange Sequenz stellt eine Collagenase Erkennungs- und Spaltstelle dar. Das Produkt mit 
diesem Insert wurde E3CA genannt. Das fur diese Sequenz kodierende 39 Basenpaare lange Oligonukleotid wurde 
mit einem DNA - Synthesegerat der Firma Applied Biosystems synthetisiert. Zur Herstellung der env-Gen Mutanten 
sowie deren Klonierung in einen Expressionsvektor siehe auch T Maniatis et al., Molecular Cloning, Cold Spring Har- 
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bor, N.Y., USA (1982). 

K nstruktion der nv-G n Mutanten 

5 a: Zerstorung der Prozessierungssequenz: 

Zur Ausbeutensteigerung wurde zunachst die naturliche Prozessierungssequenz des env-Gen Produktes zerstort. 
In dem Plasmid pVB4 [Bosch, V. und Pawlita, M., "J. Virol. 64, 2337-2344 (1990)] wurde Adenosin 7334gegen Cytosin 
ausgetauscht (A 7334 C), was beim Protein einen Austausch von Arginin 511 gegen Serin (Arg 511 Ser) bewirkt. 
10 Das so abgeanderte Plasmid pVB4 wurde danach kombiniert mit dem die Proteasespaltstelle enthaltenden E3CA- 
Plasmid (siehe unter c:). Hierzu wurde das 5^-Ende von pVB4 (Sail/Hindi 1 1 -Fragment) mit dem 3*-Ende des E3CA- 
Plasmids (Hindi I l/Xhoi -Fragment) ligiert und in den p-Btuescript Kloniert. 

b: Site-directed Mutagenese: 

15 

Gen von BH10 env (Sall/Xhol Fragment) wurde in einen M13 Vektor kloniert. Zum BH10-Kion siehe Ratner et al. 
"Nature" 313, 277-284 (1985). Die Mutagenese zur Erzeugung der EcoR I - Erkennungssequenz erfolgte nach I 
Kunkel et al. ["Meth. Enzymol.'154 ( 367-382 (1987)] mit dem Oligonukleotid MAN 59: 

20 

5" GAA CAA GAA TTC* TTG GAA TTA GAT AAA TGG 3* 
659 660 

25 Die mutagenisierte Base A 7781 C ist mit einem Stern markiert, die EcoR l-Erkennungsstelle ist fett markiert. Die 

Zahlen geben die Position der entsprechenden Aminosauren im env-Gen Produkt an. 

Die Verifizierung erfolgte mittels Sequenzierung. Diesoerhaltene env-Gen Mutante wird bezeichnet als E3 (BH10, 
A7781C). 

30 c: Insertion von kompiementaren Oligonukleotiden: 

Die im Blueskript pks+ enthaltene EcoR I E rkennungssequenz wurde zerstort durch Offnen mittels EcoR I, Auff ullen 
mittels DNA Polymerase I (Klenow Fragment) und Verbinden der Enden mittels Ligase. Danach wurde env E3 in 
Blueskript pks-j- subkloniert. Dann wurde E3 mit EcoR I linearisiert und Ober ein Agarosegel gereinigt. 
35 Nun erfolgte die Insertion der 39 Nukleotide langen fur die Collagenasespaltstelle codierenden Sequenz in diese EcoR 
I Erkennungsstelle von E3: 



< r Man81 3- 

^ Man82 5* 

Die so erhaltene Mutante wird E3CA genannt. Zwei weitere Mutanten wurden erzeugt unter Verwendung der kom- 
piementaren Oligonukleotidsequenzen Man83 und Man84 (E3CB) sowie Man85 und Man86 (E3CC). Diese Oligonu- 
kleotidsequenzen sind im folgenden dargestellt: 



50 

5 - AATTAGTTCCTGCCGGTCCAAG AGGTCCAAGGGGACCGA -3' 

[M]an82: 

55 5 X - AATTTCGGTCCCCTTGGACCTCTTGGACCGGCAGG AACT -3' 
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SVJanSS: 

5 V - AATTAGCCGTACCTGCCGGACCGCGTGGACCACGCGGACCTA -3* 

s 

(Wian84: 

5'. AATTTAGGTCCG CGTGGTCCACGCGGTCCG G CAGGT ACGGCT -3* 

10 

GVian85: 

5 % - AATTAGCAGCTGGTCCCGCAGGACCTCGCGGTCCTAGAGGTCCTA -3* 

15 

RflanSS: 

5 - AATTTAGGACCTCTAGGACCGCG AGGTCCTGCGGG ACCAGCTGCT -3 

20 

Zur Insertion der komplementaren Oligonukleotide in die EcoR l-Erkennungsstelle in E3 wurden die Oligonukleo- 
tide in 150 mM NaCI, TE (10mM Tris, 0,1mm EDTA. pH 8) gemischt (1:1, moI:mol). AnschlieBend wurde 2 h bei 95°C 
erhitzt und dann uber 30 min auf Raumtemperatur abkuhlen gelassen. Danach erfolgte die Ligase-Reaktion zusammen 
mit linearisiertem E3 (pks+) bei hohem UberschuG an dem jeweiligen Oligonukteotidpaar. Die so hergesteliten Plasmide 
25 wurden in Echerichia coli DH5 transformiert und durch Sequenzierung analysiert. Die Ausbeute an neu rekombinanten 
Plasmiden betragt uber 90%. 

d: Klonierung in den Expressionsvektor pSVL: 

30 Zur Expression der env-Gene wurden diese in den Expressionsvektor pSVL (Pharmacia, Uppsala, Schweden) 

kloniert (in pSVL wurde vorher die unique BamHI Erkennungsstelle deletiert). pSVL wurde mit Xhol linearisiert und die 
env-Gene als Sall/Xhol -Fragment (BH 10 Klon) subkloniert. Die env-Gene wurden unter die Kontrolle des SV40 Late 
Promotors gestellt. 

Eine weitere Moglichkeit, einen die verschiedenen Gene enthaltenden Expressionsvektor herzustellen, besteht 

35 jm sogenannten PCR (Polymerase Chain Reaction) -constructing. Eine Ubersicht uber diese Methodik ist zu finden 
bei Jones. D.H. et al, "Nature", 344, 793-794 (1990). 

Die env-Gen Mutanten E3CB und E3CC wurden aus folgendem Grund hergestellt: Es bestand durchaus die Mog- 
lichkeit, daG die Ausrichtung der Collagenasespaltstelle innerhalb der a-Helix Einfluf3 auf die Funktionsfahigkeit haben 
konnte. Da in einer a-Helix drei Aminosauren ungefahr eine voile Umdrehung der Helix ausmachen, wurde durch 

40 Einfugen einer Aminosaure Alanin (E3CB)bzw. zweier Aminosauren Alanin (E3CC) die Ausrichtung der Collagenase- 
spaltstelle innerhalb der a-Helix urn ca. 120° bzw. urn ca. 240° verschoben. Die dadurch erhaltenen Mutanten E3CB 
und E3CC fOhrten aber zum gleichen positiven Ergebnis wie die Mutante E3CA. 

Die Expression der verschiedenen env-Gene wurde in COS7-Zellen durchgefuhrt COS7-Zellensind Fibroblasten, 
es konnen stattdessen aber im Prinzip alle eukaryontischen Zeilen verwendet werden wie z.B. CV1 -Zelien, Hefezeilen, 

45 Insektenzellen [Summers, M.D. und Smith, G.E. : A Manual of Methods for Baculovirus Vectors and Insect Cell Culture 
Procedures. Texas Agricultural Experiment Station; Bulletin No. 1555, (1988)] etc. Die COS 7-Zellen wurden mit den 
pSVL Plasmiden durch Elektroporation transformiert und anschlieBend fur 48h in vollstandigem Wachstumsmedium 
[Gluzman.Y. et al.; 'CeH" 23, 175-182 (1981)] inkubiert. Danach wurden die Zelien geerntet und die env-Proteine ana- 
lysiert. Fur die Transformation der Zeilen mit dem Expressionsvektor konnen alle gangigen Verfahren angewandt wer- 

50 den, die Elektroporation ergibt aber im vorliegenden Fall besonders gute Erfolgsraten zwischen 10 und 50%. 

Elektroporation: 

Ca. 10 7 (2 x 10 6 - 5 x 10 7 ) COS 7 Zeilen in logarithmischer Wachstumsphase wurden trypsiniert und mit DMEM 
55 (Dulbecco Modified Eagles' Medium) gewaschen. Zur Elektroporation wurden die Zelien mit 5 - 30 (ig pSVL in DMEM 
versetzt und in einem BioRad Gene Pulser elektroporiert (Raumtemperatur; 800 uJ; 250V; 500 u.F; 0,4 cm Kuvette). 

Zur Analyse, ob die Collagenasespaltung zum gewunschten Erfolg fuhrt, also ob nach Collagenasebehandlung 
der Mutante E3CA eine native Ektodomane des env-Glykoproteins (gp140) extrahiert werden kann, wurden nach hy- 
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potonischerZellyse mittels Sucros -Dichtezentrifugation Membranpraparationen hergestellt [Schawaller, M. etal., "Vi- 
rology" 172, 367-369 (1989)1. 

Reinigung der M m bran preparation: 

5 

Membranpraparation mehrfach waschen, in HEPES buffered saline (HBS: 10 mM HEPES 7,8; 150 mM NaCt) 
aufnehmen: + 1/10 Vol. 10 x HBS, + 1/100 Vol. 1 M CaCI 2 , + 1/5 Vol. 20 % p-D-Octylglucosid bei 37°C. Danach 
Behandlung mit Potter. Mehrere Stunden bei 37°C inkubieren. AnschlieBend zentrifugieren fur 30 min. bei 100 000 x 
g und 37 a C. Der erhaltene Uberstand wurde dann einem Proteaseverdau unterzogen mit gereinigter Collagenase (EC 
10 3.4.24.3.) von Clostridium histolyticum (Sigma C0773, Deisenhofen) in Konzentrationen zwischen 1 ,2 und 333 mU/ml. 

Collagenase verdau : 

Der Collagenaseverdau wurde in folgendem Puffer fur 3 h bei 37°C durchgefuhrt: 

15 

300 mM NaCI 

20 mM HEPES (Hydroxyethylpiperazinethansulfonsaure), pH 7,8 
10mMCaCI 2 
50^M ZnCI 2 
20 4% p-D-Oktylglucosid 

Diesem Puffer konnen folgende Proteaseinhibitoren zugef ugt werden, um unspezifische Proteolyse zu minimieren: 



25 



30 



35 



40 



45 



55 



1 nM E64 

1 |iM Pepstatin A 

1mM PMSF (Phenylmethylsulfonylfluorid) 



(Cystein-Proteaseinhibitor) 
(Aspartyl-Proteaseinhibitor) 
(Serin-Proteaseinhibitor) 



Statt p-D-Oktylglucosid konnen auch andere milde Detergentien wie CHAPS oder DOC (Desoxycholat) verwendet 
werden. Zur Wirkung verschiedener Detergentien auf Membranproteine siehe auch Womack, M.D. et al. "Biochim. 
Biophys. Acta" 733, 210-215 (1983). 

Die optimale Collagenasekonzentration liegt zwischen 50 und 250 mU/ml (3h, 37°C). bei hdheren Konzentrationen 
treten verstarkt unspezifische Verdau produkte auf und die Ausbeute an gewunschtem Produkt, einem 140 kD Glyko- 
protein, wird geringer. 

Aufreinigung eines 140 kD env-Glykoproteins (gp140): 



a: Lentil lectin-Affinitatschromatographie : Die proteolysierte Fraktion wurde 1 :1 verdunnt mit destilliertem Wasser 
und aufgegeben auf eine Lentil Lectin Sepharose 4B - Saule (Pharmacia 17-0444-0'). AnschlieBend wurde gewaschen 
mit 5 Saulenvolumen HBS, 2% p-D-Oktylglucosid, danach mit 5 Saulenvolumen HBS und dann mit 5 Saulenvolumen 
10 mM HEPES (pH 7,8), 50 mM NaCI. AnschlieBend wurde eluiert mit 500 - 1000 mM a-D-Methyl-Mannosid in 10 mM 
HEPES, 50 mM NaCI (evtl. erwarmen auf 37°C). Zur Lentil lectin-Affinitatschromatographie siehe auch Hayman, MJ. 
et aL, "FEBS letters" 29 (2), 185-188 (1973). 

Das Eluat wurde anschlieBend aufkonzentriert Gp140 liegt jetzt in einer Reinheit von ca. 50 - 70% vor. 

b: Mono Q FPLC : Das Eluat aus a: wurde aufgenommen in 10 mM BTP (Bis-Trispropane), 50mM H 3 B0 4 , pH 8,2 
und auf eine Mono Q HR 5/5 Saule (Pharmacia) aufgegeben, wobei die Proteinkonzentration bei etwa 1 mg/ml lag. 
Die Saule wurde eluiert mit einem NaCI-Gradienten von 30 - 600 mM uber 40 min, 0,5 - 1 mt/min, UV-Monitor bei 280 
nm. Analyse durch SDS PAGE Coomassie und/oder Western Blot. Das gp1 40 env-Protein eluiert bei ca. 400 mM NaCI. 
Gp140 liegt jetzt in einer Reinheit von ca. 80-90% vor. Die Zugabe von H 3 B0 4 (Borat) zum Puffer bringt den Vorteil, 
50 daG dadurch das Aggregieren der Glykoproteine verhindert wird. Diese Verhinderung der Aggregation der Glykopro- 
teine durch H 3 B0 4 beruht wahrscheinlich auf einer Komplexierung der in Glykoproteinen hauftgen vincinalen Hydro- 
xylgruppen (Anspruch 8). 

c: Sucrosedichtezentrifuqation : Auf einen vorgeformten Sucrosegradienten 5-20% in HBS (10 mM HEPES, pH 
7,8; 150 mM NaCI) wurde oben ca. 1 ml Eluat aus b: aufgeladen und in einem SW41 -Rotor (Beckmann) zentrifugiert 
bei 35 000 UpM, 16h, 5°C. AnschlieBend Entnahmevon 10 Fraktionen (von unten nachoben). In Fraktion 5 hat gp140 
eine Reinheit von 90 - 95%. Analyse erfolgte durch SDS PAGE und/oder Western Blot. Da wahrend der Zentrifugation 
keine Ca-lonen im Puffer enthalten sind, kann statt HEPES-Puffer beispielsweise auch Phosphatpuffer verwendet 
werden. 



10 



EP 0 679 187 B1 



Die Proteolyseprodukte wurden analysiert mittels SDS-PAGE (Natriumlaurytsulfat-PolyacrylamidgQlelektrophore- 
se) und anschlieGendem Immunoblotling unter Verwendung eines polyklonalen Kaninchenserums, gerichtet gegen 
gp120, das sowohl gp120, als auch gp160 erkennt 

Der Immunoblot (Western -Blot) in Fig. 3 zeigt, daR das Wildtyp env-Gen (Klon BH10) und die Mutante E3CA etwa 
gleiche Mengen an gp160 exprimieren. Offensichtlich verlauft auch die proteolytische Prozessierung von gp160 zu 
gp120 und gp41, weiche im Gotgi-Apparat ablauft, bei Wildtyp-env- und Mutanten-env-Protein gleich, wenn die Pro- 
zessierungssequenz intakt ist. Nach Behandlung mit bakterieller Collagenase ergab das E3CA -env-Protein ein neues 
Verdauprodukt, dessen monomere Form eine elektrophoretische Mobilitat von ca. 140 kD aufweist, welches beim 
Verdau des Wildtyp-env-Proteins nicht gef unden wurde. Dieses Verdauprodukt ist die gewunschte native Ektodomane 
des env-Glykoproteins. Die mit 140 kD etwas geringere elektrophoretische Mobilitat des neuen Verdauprodukts als 
die von gp120 ergibt sich daraus, daft die Collagenasespaltstelle bei Aminosaure 659 des Gesamtproteins gp160 im 
Bereich der Domane gp41 eingebaut wurde. Die Domane gp120 endet bei Aminosaure Arginin 511 (siehe auch Fig. 
1). Die neu hergestellte native Ektodomane des HIV-1 env-Glykoproteins, gp140, besteht also aus der gesamten Do- 
mane gp120, einem 148 Arninosauren langen Teilstuck der Domane gp41 sowie dem nach Collagenaseverdau ver- 
bleibenden Stuck der collagenahnlichen Sequenz. Dieses letztgenannte Stuck, das das C-terminale Ende des Glyko- 
proteins bildet, ist zwar eine Art Fremdkorper in dem erfindungsgemaBen Glykoprotein, stort aber dessen Funktion 
nicht. Es kann, braucht aber nicht unbedingt entfernt zu werden. 

Die elektrophoretische Mobilitat von gp1 20 vom Wildtyp-env- und vom E3CA-env-Protein wird durch die Collagenase- 
behandlung nicht verandert. Das zeigt, daB die in der Mutante E3CA insertierte Collagenasespaltstelle von der bak- 
teriellen Collagenase spezifisch erkannt und gespalten wird. 

Ein weiterer Nachweis dafur, da(3 die in der Mutante E3CA insertierte Collagenasespaltstelle von der bakteriellen 
Collagenase spezifisch erkannt und gespalten wird, ergibt sich aus den Ergebnissen der Sedimentationsanalyse der 
Collagenasespaltprodukte (Fig. 4). Membranpraparationen von COS 7-Zellen, die das Wildtyp- oder das E3CA-env- 
Gen exprimieren, wurden mit 4% p-D-Oktylglycosid extrahiert und wie oben beschrieben mit Collagenase verdaut. Die 
erhaltenen Verdauprodukte wurden mittels Sucrose-Dichtezentrifugation uber einen vorgeformten 5% - 20% Sucro- 
segradienten in 10 mM HEPES, pH 7.8, 150 mM NaCI in Abwesenheit von Detergentien zentrifugiert fur 16 h bei 35 
000 UpM in einem SW41 Rotor (Beckmann). Danach wurden insgesamt zehn Fraktionen entnommen und mittels SDS- 
PAGE und Immunoblotting auf ihren Gehalt an env-Proteinen untersucht. gp120 wurde in beiden Fallen in den Frak- 
tionen 7 und 8 wiedergefunden, was dem monomeren gp1 20 mit einem Sedimentationskoeffizienten von 7S entspricht. 
Das Verdauprodukt von 140kD, das nur bei der E3CA-Mutante und nicht beim Wildtyp auftrat, wurde dagegen in 
Fraktion 5 wiedergefunden, was einem Sedimentatiortskoeffizienten von 11 S entspricht. 

In einer bevorzugten AusfOhrungsform wird ein rekombinantes vaccinia Virus (VV) als Expressionsvektorverwen- 
det. Die Konstruktion dieses rekombinanten Vaccinia Virus wird im folgenden Ausfuhrungsbeispiel naher beschrieben. 

Als Ausgangsmaterial wurde das Vaccinia shuttle plasmid p2100 verwendet [Patel, D. D. etal., "Proc. Natl. Acad. 
Sci. USA" 85, 9431 -9435 (1 988)]. Dieses enthalt neben bakteriellem Origin und Resistenzgen folgendes Genf ragment: 



Tk-L Cowpox 160K MCS Tk-R 
\ \ LZZ1 E=3~ 

Tk-L = Linker Arm des Thymidinkinase-Gens 
Tk-R = Rechter Arm des Thymidinkinase-Gens 
Cowpox 160K= Promotor/Enhancer Sequenzen 
MCS = Multiple cloning site 

Durch Klonieren von doppelstrangigen Oligonukleotiden wurde 3*zum Promotor eine Lac O Sequenz, 24 bp 
palindrom, insertiert und die MCS urn mehrere unique Endonuklease-Erkennungsstellen erweitert Die Lac O Sequenz 
ist notig, urn die Transkription in E. coli auf ein Minimum zu unterdrQcken. 

In die neuen Restriktionsstellen wurde das jeweilige env-Gen (Wildtyp oder Mutante: aus pks Plasmid) cloniert (z. 
B. E3CA) [zur Methodik siehe Chakrabarti, S. et al., "Molec. Cell Biol." 5, 3403-3409 (1985)]. 

Man erhalt folgendes Konstrukt: 
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Tk-L Cowpox 160K env Tk-R 




LacO 

Fur die Herstellung rekombinanter Vaccinia Viren wurden die Plasmide analysiert durch Restriktionsanalyse und 
partielle Sequenzierung. Die Plasmide wurden in CV 1 Zeilen transfiziert durch Elektroporation (Bedingungen wie bei 

10 COS-7 Zeilen, siehe erstes Ausfuhrungsbeispiel) und mit Wildtyp VV (Stamm Copenhagen) infiziert ( Multiplicity of 
Infection (M O I) < 1). Es entstehen durch homologe Rekombination im Thymidinkinase-Gen des Plasmids mit dem 
Thymidinkinase-Gen des VV mit einer Wahrscheinlichkeit von etwa 1/1000 - 1/10000 rekombinante VV, durch die das 
env-Gen exprimiert werden kann. Da diese phanotypisch TK* sind, konnen sie durch 5'-Bromodeoxyuddin (BdUR)- 
Selektion in HTK" Zeilen positiv selektioniert werden. Zwei Runden BdUR/HTK- Selektion und anschlieftendes "Pla- 

1$ quen" (identifizieren von Plaques und entnehmen von rekombinanten VV) aus CV 1 Zeilen ergibt ca. 50-90% env 
exprimierende Plaques (W env), die durch Western Blot einer 1 ml Kultur identifiziert werden konnen. Nochmalig s 
Plaquen fuhrt zu dem gewunschten rekombinanten Vaccinia Virus, durch den env exprimiert werden kann. 

Verwendung der viralen Mem bran protein domanen: 

20 

Die erfindungsgemaBen nativen Domanen viraler Membranproteine konnen als Impfstoff gegen Viren eingesetzt 
werden. Hierzu werden sie dem Patienten vorzugsweise in Kombination mit geeigneten Adjuvantien verabreicht. Vorher 
mussen allerdings eventuell noch enthaltene Pufferbestandteile, wie beispielsweise HEPES, entfernt werden. Dies 
kann erfolgen z.B. durch Dialyse gegen physiologische Kochsalzlosung in Phosphatpuffer. 

25 Weiterhin konnen die nativen Domanen der viralen Membranproteine zur Immuntherapie verwendet werden. 

Auch fur diagnostische Zwecke sind die nativen viralen Proteindomanen geeignet. Zum einen konnen sie als An- 
tigen beispielsweise in Immunoassays zum Nachweis spezifischer Antikorper dienen, zum anderen konnen sie auch 
eingesetzt werden zur Gewinnung von Antikorpern, sowohl monoklonalen als auch polyklonalen Antikorpern, die dann 
wiederum zum direkten Nachweis des Virus dienen konnen. 

30 Ein weiterer wichtiger Verwendungszweck der aufgereinigten nativen Domanen viraler Membranproteine ist ihre 

Verwendung zur Kristallisation. Ist das Protein in kristalliner Form vorhanden, kann die dreidimensionate Struktur er- 
mittelt werden. Dies ist insbesondere dahingehend interessant, als dadurch moglich wird, die genaue Struktur der 
Bindungstasche aufzuklaren. Kennt man diese Struktur, ist es eventuell moglich, Inhibitoren zu konstruieren, das heiBt, 
kleinere Molekule, die genau in diese Bindungstasche hineinpassen und damit die Bindung des Proteins, also des 

35 Virus, an das CD4-MolekOI, den Rezeptorder Wirtszelle, zu blockieren. 



Patentanspruche 

40 1. Verfahren zur Gewinnung von isolierten Ektodomanen viraler Membranproteine in nativer, oligomerer und glyko- 
sylierter Form, dadurch gekennzeichnet, daft 

in das Gen, das fur ein virales, die gewunschte Ektodomane enthaltendes Membranprotein kodiert, eine Nu- 
kleotidsequenz insertiert wird, die fur eine Aminosauresequenz kodiert, welche eine Erkennungssequenz fur 
45 proteinspaltende Enzyme darstellt, 

die so erhaltene Gen-Mutante in eukaryontischen Zeilen zum Erhait des Membranproteins in nativer, oligo- 
merer und glykosylierter Form einschlieBlich der insertierten Erkennungssequenz exprimiert wird, 

50 - die Ektodomane in nativer, oligomerer und glykosylierter Form durch enzymatische Spaltung des Membran- 

proteins mit fur die Erkennungssequenz spezifischen proteinspaltenden Enzymen von den eukaryontischen 
Zeilen oder Teilen hiervon abgetrennt wird, und 

die Ektodomane in nativer, oligomerer und glykosylierter Form aus dem Gemisch isoliert wird. 

SB 

2. Verfahren nach Anspruch 1 1 wobei eine naturliche Prozessierungssequenz des Vorlauferproteins des Membran- 
proteins durch Austausch mindestens einer Aminosaure zerstort wird. 
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3. Verfahren nach Anspruch 1 od r 2, wobei die Erkennungssequenz von Proteasen oder von Lipasen Gber Glyco- 
lipidankern erkannt und gespalten wird. 

4. Verfahren nach einem der Anspruche 1 bis 3, wobei die zu gewinnnenden Ektodomanen die Ektodomanen des 
5 env-Glykoproteins von HIV sind. 

5. Verfahren nach Anspruch 4, wobei die Nukleotidsequenz in einen Bereich des fur das env-Glykoprotein kodieren- 
den Gens insertiert wird, der bei dem daraus exprimierten env-Glykoprotein dem Bereich entspricht, der begrenzt 
wird durch die erste und f unfzigste Aminosaure vor Beginn des transmembranen Bereichs des env-Glykoproteins. 

10 

6. Verfahren nach Anspruch 4 oder 5, wobei die Erkennungssequenz in einen Bereich des env-Glykoproteins von 
HIV eingebaut wird, der durch die Aminosauren 645 und 673 begrenzt wird. 

7. Verfahren nach Anspruch 6, wobei der Bereich durch die Aminosauren 656 und 663 begrenzt wird. 

15 

8. Verfahren nach einem der Anspruche 4 bis 7, wobei die Erkennungssequenz zwischen den Aminosauren 659 und 
660 in das env-Glykoprotein von HIV eingebaut wird. 

9. Verfahren nach einem der Anspruch 1 bis 8, wobei 

20 

die Erkennungssequenz die folgende allgemeine Form besitzt: 



-(G-P-X) n - 

25 

wobei n eine ganze Zahl groBer 1 , insbesondere 3, und X eine der 20 durch den genetischen Codefestgelegten 
Aminosauren ist, und 

das fur die Spaltung verwendete Enzym eine Collagenase ist. 

30 

10. Verfahren nach Anspruch 9, wobei die Collagenase eine bakterielle Collagenase ist. 

11. Verfahren nach einem der Anspruche 1 bis 10, worin der Puffer, der bei der Reinigung der gewunschten Ektodo- 
mane aus dem Gemisch nach der enzymatischen Spaltung verwendet wird, Borat in einer Konzentration zwischen 

35 1 und 200 mM enthalt. 

12. Verfahren nach Anspruch 11 , wobei der Puffer Borat in einer Konzentration zwischen 30 und 100 mM, enthalt. 

13. Verfahren nach einem der Anspruche 1 bis 12, worin ein fur den Einbau einer Erkennungssequenz in Membran- 
40 proteine geeigneter Bereich dadurch identifiziert wird, daB entsprechend der Sequenz des untersuchten Mem- 

branproteins synthetisierte, kurze, uberlappende Peptide mit Serum eines gegen dieses Membranprotein immu- 
nisierten Saugetieres gemischt werden, wobei diejenigen Peptide, die mit den in diesem Serum enthaltenen An- 
tikorpern reagieren, fur den Einbau einer Erkennungssequenz geeignete Bereiche in dem untersuchten Membran- 
protein darstellen. 

45 

14. Verfahren nach Anspruch 13, wobei die synthetisierten, kurzen, uberlappenden Peptide mit Serum HIV positiver 
Menschen gemischt werden. 

15. Verfahren nach Anspruch 13 oder 14, wobei die synthetisierten Peptide eine Lange zwischen 5 und 30 Amino- 
50 sauren, insbesondere zwischen 12 und 16 Aminosauren, aufweisen. 

16. Verfahren nach Anspruch 15, wobei die synthetisierten Peptide eine Lange zwischen 12 und 16 Aminosauren 
aufweisen. 

55 17. Isolierte Ektodomanen viraler Membranproteine, dadur h gekennz ichn t daB, sie in nativer, oligomerer und 
glykosylierter Form vorliegen. 

18. Isolierte Ektodomanen nach Anspruch 17, wobei sie Ektodomanen des env-Glykoproteins von HIV sind. 
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19. Isolierte Ektodomanen nach Anspruch 18, wobei sie in tetramerer Form vorliegen. 

20. Isolierte Ektodomanen nach einem der Anspruche 1 8 oder 1 9, wobei ihre monomere Form eine elektrophoretische 
Mobilitat von etwa 140 kD besitzt. 

21. Isolierte Ektodomanen nach einem der Anspruche 17 bis 20, wobei sie aus der Domane gp120 des HIV env- 
Glykoproteins, dem 131 bis 165 Aminosauren langen aminoterminalen Stuck der Domane gp41 des HIV env- 
Glykoproteins sowie gegebenenfalls dem nach der enzymatischem Spaltung verbleibenden Stuck der Erken- 
nungssequenz gemaB Anspruch 5 zusammengesetzt sind. 

22. Isolierte Ektodomanen nach Anspruch 21, wobei das aminoterminalen Stuck der Domane gp41 des HIV env- 
Glykoproteins 148 Aminosauren lang ist. 

23. Pharmazeutische Zusammensetzung, enthaltend isolierte Ektodomanen viraler Membranproteine nach einem der 
Anspruche 17 bis 22. 

24. Pharmazeutische Zusammensetzung nach Anspruch 23 als Impstoff gegen Viren, insbesondere HIV, oder zur 
Immuntherapie, insbesondere bei HIV-positiven Patienten. 

25. Diagnostisches Mittel, enthaltend isolierte Ektodomanen viraler Membranproteine nach einem der Anspruche 17 
bis 22. 

26. Diagnostisches Mittel nach Anspruch 25 zur Diagnose entsprechender viraler Infektionen, insbesondere Infektio- 
nen mit HIV. 

27. Verwendung isolierter Ektodomanen viraler Membranproteine nach einem der Anspruche 1 7 bis 22 fur die Gewin- 
nung von polyklonalen oder monoklonalen Antikorpern, die gegen diese Proteindomanen gerichtet sind. 

28. Verwendung isolierter Ektodomanen viraler Membranproteine nach einem der Anspruche 17 bis 22 fur die Kristal- 
lisation dieser Proteindomanen. 



Claims 

1. A method of obtaining isolated ectodomains of viral membrane proteins in native, oligomeric and glycosylated 
form, characterized in that 

A nucleotide sequence coding for an amino acid sequence which represents a recognition sequence for pro- 
tein-splitting enzymes is inserted into the gene coding for a viral membrane protein containing the desired 
ectodomain, 

The gene mutant obtained in this manner is expressed in eukaryotic cells for obtaining the membrane protein 
in native, oligomeric and glycosylated form including the inserted recognition sequence, 
The ectodomain is separated in native, oligomeric and glycosylated form by enzymatic splitting of the mem- 
brane protein with protein-splitting enzymes specific for the recognition sequence from the eukaryotic cells or 
parts of then, and 

The ectodomain is isolated in native, oligomeric and glycosylated form from the mixture. 

2. The method according to claim 1 in which a natural processing sequence of the precursor protein of the membrane 
protein is destroyed by the replacement of at least one amino acid. 

3. The method according to claim 1 or 2 in which the recognition sequence is recognized and split by proteases or 
by lipases via glycolipid anchors. 

4. The method according to one of claims 1 to 3 in which the ectodomains to be obtained are the ectodomains of the 
env glycoprotein of HIV. 

5. The method according to claim 4 in which the nucleotide sequence is inserted into an area of the gene coding for 
the env glycoprotein which area corresponds in the case of the env glycoprotein expressed therefrom to the area 
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limited by the first and th fiftieth amino acid before the beginning of the transmembrane area of the env glyco- 
protein. 

6. The method according to claim 4 or 5 in which the recognition sequence is inserted into an area of the env glyc- 
s oprotein of HIV which is limited by the amino acids 645 and 673. 

7. The method according to claim 6 in which the area is limited by the amino acids 656 and 663. 

8. The method according to one of claims 4 to 7 in which the recognition sequence is inserted into the env glycoprotein 
10 of HIV between amino acids 659 and 660. 

9. The method according to one of claims 1 to 8 in which 

The recognition sequence has the following general form: 

15 

-(G-P-X) n - 

in which n is a whole number greater than 1 , especially 3, and X is one of the 20 amino acids determined by 
20 the genetic code and 

The enzyme used for the splitting is a collagenase. 

10. The method according to claim 9 in which the collagenase is a bacterial collagenase. 

25 11 . The method according to one of claims 1 to 10 in which the buffer used in the purification of the desired ectodomain 
from the mixture after the enzymatic splitting contains borate in a concentration between 1 and 200 mM. 

12. The method according to claim 11 in which the buffer contains borate in a concentration between 30 and 100 mM. 

30 13. The method according to one of claims 1 to 1 2 in which an area suitable for the insertion of a recognition sequence 
into membrane proteins is identified in that short, overlapping peptides synthesized in accordance with the se- 
quence of the membrane protein to be investigated are mixed with serum of a mammal immunized against this 
membrane protein, 

wherein those peptides which react with the antibodies contained in this serum represent areas in the mem- 
35 brane protein investigated which are suitable for the insertion of a recognition sequence. 

14. The method according to claim 1 3 in which the synthesized, short, overlapping peptides are mixed with HIV serum 
of positive humans. 

40 15. The method according to claim 1 3 or 14 in which the synthesized peptides have a length between 5 and 30 amino 
acids, especially between 12 and 16 amino acids. 

16. The method according to claim 1 5 in which the synthesized peptides have a length between 1 2 and 1 6 amino acids. 

45 17. Isolated ectodomains of viral membrane proteins, characterized in that they are present in native, oligomeric and 
glycosylated form. 

18. The isolated ectodomains according to claim 17 which are ectodomains of the env glycoprotein of HIV. 

so 19. The isolated ectodomains according to 18 which are present in tetrameric form. 

20. The isolated ectodomains according to one of claims 18 or 19 whose monomeric form has an electrophoretic 
mobility of approximately 140 kD. 

55 21 . The isolated ectodomains according to one of claims 1 7 to 20 which are composed of domain gp1 20 of the HIV 
env glycoprotein, the 1 31 to 165 amino acids long amino-terminal section of domain gp41 of the HIV env glyco- 
protein as well as optionally the section of the recognition sequence according to claim 5 remaining after the 
enzymatic splitting. 
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22. The isolated ectodomains according to claim 21 in which the amino-terminal section of domain gp41 of the HIV 
env glycoprotein is 148 amino acids long. 

23. A pharmaceutical composition containing isolated ectodomains of viral membrane proteins according to one of 
s claims 17 to 22. 

24. The pharmaceutical composition according to claim 23 as vaccine against viruses, especially HIV, or for immuno- 
therapy, especially in the case of HIV-positive patients. 

10 25. A diagnostic agent containing isolated ectodomains of viral membrane proteins according to one of claims 1 7 to 22. 

26. The diagnostic agent according to claim 25 for diagnosing corresponding viral infections, especially infections with 
HIV. 

is 27. The use of isolated ectodomains of viral membrane proteins according to one of claims 17 to 22 for the obtention 
of polyclonal or monoclonal antibodies directed against these protein domains. 

28. The use of isolated ectodomains of viral membrane proteins according to one of claims 17 to 22 for the crystalli- 
zation of these protein domains. 

20 

R even di cat ions 

1. Precede d'obtention d'ectodomaines isoles de proteines virales membranaires, sous forme native, oligomere et 
^5 glycosylee, caracteris6 en ce que: 

dans le gene qui code pour une proteine membranaire virale contenant I'ectodomaine concerne, on insere 
une sequence nucleotidique qui code pour une sequence d'acides amines qui forme une sequence de recon- 
naissance pour une enzyme de coupure de proteine, 

30 - le gene mutant ainsi obtenu est exprime dans des cellules eucaryotes pour I'obtention de la proteine mem- 

branaire sous forme native, oligomere et glycosylee incluant la sequence de reconnaissance inseree, 
I'ectodomaine, sous forme native, oligomere et glycosylee, est separee des cellules eucaryotes ou des parties 
de celies-ci par coupure enzymatique de la proteine membranaire a I'aide d'une enzyme de coupure de pro- 
teine, specifique de la sequence de reconnaissance, 

55 - I'ectodomaine, sous forme native, oligomere et glycosylee, est isole du melange. 

2. Procede selon la revendication 1 , dans lequel une sequence de traitement de la prot6ine precurseur de la proteine 
membranaire est degradee par substitution d'au moins un acide amine. 

40 3. Procede selon la revendication 1 ou 2, dans lequel la sequence de reconnaissance d'une protease ou d'une lipase 
est reconnue et coupee par I'intermediaire d'un glycolipide. 

4. Procede selon Tune quelconque des revendications 1 a 3, dans lequel les ectodomaines a obtenir sont des ecto- 
domaines de glycoprotein es-env de VI H. 



45 



so 



ss 



5. Procede selon la revendication 4, dans lequel la sequence de nucleotides est inseree dans un domaine du gene 
codant pour la glycoproteine-env, qui correspond au domaine par lequel est exprime la glycoproteine-env, qui est 
Iimit6 par le premier et le cinquantieme acide amine avant le debut du domaine transmembranaire de la glycopro- 
teine-env. 

6. Procede selon Tune quelconque des revendications 4 ou 5, dans lequel la sequence de reconnaissance est inseree 
dans un domaine de la glycoproteine-env du VI H limite par les acides amines 645 et 673. 

7. Procede selon la revendication 6, dans lequel le domaine est limite par les acides amines 656 et 663. 

8. Procede selon Tune quelconque des revendications 4 a 7, dans lequel la sequence de reconnaissance est inseree 
dans la glycoproteine-env du VI H entre les acides amines 659 et 660. 
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9. procede selon Tune qu Iconque des rev ndications 1 a 8, dans lequel: 

la sequence de reconnaissance consiste en la forme gen§rale suivante: 

-(G-P-X) n - 

dans laquelle 

n est un nombre entier superieur a 1 , de preference 3 et X est un des 20 acides amines definis par le code 
genetique et 

I'enzyme utilised pour la coupure est une collagenase. 

10. Procede selon la revendication 9 dans lequel la collagenase est une collagenase bacterienne. 

11. Procede selon I'une quelconque des reve ndications 1 a 10, dans lequel le tampon employe* pour la purification de 
I'ectodomaine recherche du melange apres la coupure enzymatique contient du borate a une concentration 1 a 
200 mM. 

12. Procede selon la revendication 11, dans lequel le tampon contient 30 a 100 mM de borate. 

13. Procede selon I'une quelconque des revendications 1 a 12, dans lequel un domaine convenant a I'insertion d'une 
sequence de reconnaissance dans une proteine membranaire est identifie par melange de peptides courts che- 
vauchants synthetis§s, correspondant a la sequence de la proline membranaire examinee avec un serum de 
mammifere immunise contre cette proteine membranaire, dans lequel les peptides qui reagissent avec les anti- 
corps contenus dans ce serum forment, dans la proteine membranaire examinee, un domaine convenant a I'in- 
sertion d'une sequence de reconnaissance. 

14. Procede selon la revendication 1 3 dans lequel les peptides courts, chevauchants, synthetis^s sont melanges avec 
du serum d'un etre humain positif pour le VIH. 

15. Procede selon I'une quelconque des revendications 1 3 ou 1 4, dans lequel les peptides synth6tis6s presentent une 
longueur de 5 a 30 acides amines, en particulier de 12 a 16 acides amines. 

16. Procede selon la revendication 15, dans lequel les peptides synthetisesont une longueur de 12a 16 acides amines. 

17. Ectodomaines isoies des proteines membranaires virales, caracterises en ce qu'ils se trouvent sous forme native, 
oligomere et glycosyiee. 

18. Ectodomaines isoies selon la revendication 17, dans lequel ceux-ci sont des ectodomaines de la glycoproteines- 
env de VIH. 

19. Ectodomaines isoies selon la revendication 18, dans lequel ceux-ci se trouvent sous forme de tetramere. 

20. Ectodomaines isoies selon I'une quelconque des revendications 18 ou 19, dans lequel sa forme monomere pr£- 
sente une mobilite electrophor6tique d'environ 140 kD. 

21. Ectodomaines isoies selon i'une quelconque des revendications 17 a 20, dans lequel ceux-ci sont constitues du 
domaine gp120 de la glycoproteine-env de VIH, du segment N-terminal du 131 au 165 acide amine du domaine 
gp41 de la glycoproteine-env de VIH, ainsi qu'eventuellement du segment restant apres coupure enzymatique de 
la sequence de reconnaissance selon la revendication 5. 

22. Ectodomaines isoies selon la revendication 21, dans lequel le segment a N-terminal du domaine gp41 de la gly- 
coproteine-env du VIH a une longueur de 148 acides amines. 

23. Composition pharmaceutique contenant des ectodomaines isoies de proteines membranaires virales selon I'une 
quelconque des revendications 17 a 22. 

24. Composition pharmaceutique selon la revendication 23 en tant que vaccin antiviral, en particulier contre le VIH ou 
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pour une immunotherapie, en particulier ch z des patients posltifs pour le VIH. 

25. Moyen de diagnostic, comprenant des ectodomaines isoles de proteines membranaires virales selon I'une quel- 
conque des revendications 17 a 22. 

5 

26. Moyen de diagnostic selon la revendication 25, pour le diagnostic des infections virales correspondantes, en par- 
ticulier des infections par le VIH. 

27. Utilisation d'ectodomaines isoles de proteines membranaires virales selon I'une quelconque des revendications 
to 17 a 22, pour I'obtention d'anticorps polyclonaux ou monoclonaux qui sont diriges contre ces domaines de protei- 
nes. 

28. Utilisation d'ectodomaines isoles de proteines membranaires virales selon I'une quelconque des revendications 
17 a 22, pour la cristallisation de ces domaines de proteine. 
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